# -*- coding:utf-8 -*-
import jieba
def process_standard_time(time_str):
    # Thu May 21 10:10:23 +0800 2020
    # Sun Oct 18 07:56:40 +0800 2020
    # Wed Apr 10 21:19:10 +0800 2019
    time_str = time_str.lstrip().rstrip()
    month = {"Jan": "01", "Feb": "02", "Mar": "03", "Apr": "04", "May": "05", "Jun": "06", "Jul": "07", "Aug": "08", "Sep": "09", "Oct": "10", "Nov": "11", "Dec": "12"}
    time_str = time_str.split(" ")
    processed_time = time_str[-1]
    if month.get(time_str[1]) is None:
        print(time_str)
    processed_time += "-" + month.get(time_str[1])
    processed_time += "-" + time_str[2]
    processed_time += " " + time_str[3]
    return processed_time

def process_video_url(text):
    index = text.find("http://t.cn/")
    if index != -1:
        return  text[index: index + 20]
    else:
        return ""

def process_text(text, query):
    seg_list = jieba.cut(query)

    for seg in seg_list:
        if len(seg) == 0:
            continue
        index = text.find(seg)
        if index != -1:
            text = text.replace(seg, "<span style='color:#f73131'>" + seg + "</span>")
    return text


def process_text_regex(text, search_items):
    for item in search_items:
        index = text.find(item)
        if index != -1:
            text = text.replace(item, "<span style='color:#f73131'>" + item + "</span>")
    return text


if __name__ == "__main__":
    text = "订至第五版，由@中信出版集团@雅信君 引入国内出版，受到中国社会科学院民族研究所所长陈星灿力荐！一册在手，便可了解：考古学的基本方法和理论"
    search_items = ['中国社会科学院哲学研究所', '中国社会科学院民族研究所', '新疆文物考古研究所', '中国科学院动物研究所', '中国科学院心理研究所', '中国科学院自动化研究所']
    text = process_text_regex(text, search_items)
    print(text)
    #print(process_standard_time("Thu May 21 10:10:23 +0800 2020"))
    #print(process_video_url("#我国发现长达一米的海蝎化石#【一米长的海蝎长这样！#我国首次发现4.3亿年前混翅鲎化石#】近日，中外科学家对外宣布，在我国首次发现4.3亿年前的混翅鲎化石，体长可达近一米。因其形似蝎子，故俗称为海蝎。此次发现填补了混翅鲎类在中国，乃至整个冈瓦纳大陆的空白。本研究工作由中国科学院和国家自然科学基金共同资助。（北青-北京头条编辑 梁天伊）  http://t.cn/A6Mt3Ftv"))
    #中科院苟利军隔空回应⽥野少年# 听讲之后，不得不说浩瀚神秘的星空真的令人向往。#田野里的歌声# http://t.cn/A6MOmZQx"))
    #print(process_video_url("#新疆发现大型恐龙化石#建立新属新种 命名为中国丝路巨龙和新疆哈密巨龙】近日，中外科学家对外宣布，他们在新疆哈密翼龙动物群发现大型恐龙化石，并建立了两个恐龙新属新种：中国丝路巨龙和新疆哈密巨龙，体长约为20米和17米。中科院古脊椎所、中国科学院大学汪筱林研究员为论文第一作者兼共同通讯作者，研究发表于自然（Nature）旗下的《科学报告》。（北青-北京头条编辑 梁天伊 素材由中科院古脊椎所提供） http://t.cn/A6IIqGOQ"))
    #print(process_text("【著名植物生理学家、中国科学院院士施教耐病逝，享年98岁】著名植物生理学家，中国科学院院士，中国科学院分子植物科学卓越创新中心/植物生理生态研究所研究员施教耐先生因病医治无效，24日12时50分在上海逝世，享年98岁。施教耐先生是我国植物碳代谢领域的重要奠基人。中国科学院转发送别http://t.cn/ELUAwxn中国科学院","中国科学院"))
    #a = "1234"
    #print(a[0:3])
